HarmonyOS-鸿蒙app开发 —基于javaAI文档检测校正概述

HarmonyOS-鸿蒙app开发 —基于javaAI文档检测校正概述

基本概念

文档校正提供了文档翻拍过程的辅助增强功能,包含两个子功能:

  • 文档检测:能够自动识别图片中的文档,返回文档在原图中的位置信息。这里的文档泛指外形方正的事物,比如书本、相片、画框等。
  • 文档校正:能根据文档在原始图片中的位置信息校正文档的拍摄角度,自动将拍摄视角调整到正对文档的角度上。

运作机制

  • 文档检测

    调用文档检测接口,识别图片中的文档,返回文档在原图中的位置信息。

    图1 含有文档的图片

    如上图中的红点所示,文档检测接口返回了图中相片文档四个顶点相对图像左上角的坐标信息。文档检测结果如下:

{
“resultCode”:0,
“doc”:
“{
\”bottom_left\”:{\”x\”:17,\”y\”:440},
\”bottom_right\”:{\”x\”:589,\”y\”:760},
\”top_left\”:{\”x\”:256,\”y\”:13},
\”top_right\”:{\”x\”:829,\”y\”:332}
}”
}

  • 该JSON保存了原图中相片文档四个角相对原图左上顶点的坐标信息(单位:像素),其中resultCode为返回码。

  • 文档校正

    根据文档在原始图片中的位置信息校正文档的拍摄角度(可自定义校正的区域)。

    图2 图片中的校正区域

    校正上图中深蓝色矩形(文档检测接口返回的文档区域)区域,校正后的效果如下图:

    图3 校正完成的文档图片

约束与限制

  • 支持处理的图片格式包括JPEG、JPG、PNG,最终输出的图片仅支持JPEG格式。
  • 拍摄时尽量将文档放置在与文档背景色有一定色差的平面上,并尽量让文档充满画面,保持文档边界入镜,以获得最佳效果。
  • 输入图片高和宽最小为100像素,最大为10000像素。
0 0 投票数
文章评分
订阅评论
提醒
0 评论
最旧
最新 最多投票
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x